گوگل تمام ابزارهای هوش مصنوعی‌اش را در Gemini Enterprise جمع کرد کشف شواهد جدیدی از وجود اقیانوس باستانی در مریخ چین تبدیل به بزرگ‌ترین تولیدکننده ربات‌های صنعتی جهان شد نمایش شگفت‌انگیز سه دنباله‌دار زمردین در آسمان شب پاییز ۱۴۰۴ + تاریخ و بهترین مکان رصد در ایران قطع دسترسی به اینستاگرام، فیس‌بوک و تیک‌تاک در افغانستان | فیلترینگ گسترده اینترنت توسط طالبان سقف قانونی سود موبایل‌فروشان از فروش گوشی چقدر است؟ برندگان نوبل شیمی ۲۰۲۵ اعلام شدند: مبدعان روش‌های نوآورانه‌ در طراحی و سنتز کاتالیزورهای فعال و پایدار ارزان‌ترین نسخه تسلا مدل Y رونمایی شد | تغییرات جدید برای جذب مشتریان اقتصادی دلایل اصلی خرابی زودهنگام مودم چیست؟ دومین درخشش پیاپی گوگل در نوبل فیزیک | تقدیر از پیشگامان محاسبات کوانتومی سامانه اعتراض آنلاین به جریمه‌های رانندگی راه‌اندازی شد احتمال بروز اختلال موقت در بخشی از شبکه ارتباطی خراسان رضوی در بامداد پنجشنبه (۱۷ مهر ۱۴۰۴) تقدیر اینستاگرام از برترین و نوآورترین محتواسازان با Rings Award ایلان ماسک: سال آینده یک بازی تولیدشده با هوش مصنوعی منتشر خواهیم کرد گوگل برای هک هوش مصنوعی جمینی جایزه ۲۰ هزار دلاری تعیین کرد آیا کابل شارژ هم از جعبه گوشی‌ها حذف خواهد شد؟ برندگان نوبل فیزیک ۲۰۲۵ اعلام شدند: کاشفان تونل‌زنی کوانتومی ماکروسکوپی و کوانتیزاسیون انرژی ChatGPT به ۸۰۰ میلیون کاربر هفتگی رسید | رشد بی‌سابقه در کمتر از دو سال گوگل: با محدودکردن نصب برنامه‌های اندروید از منابع غیررسمی به امنیت کاربران کمک می‌کنیم آیا قطع ارتباط با ماهواره‌های هدهد و کوثر به دلیل خرابکاری بوده است؟ برندگان جایزه نوبل پزشکی ۲۰۲۵ معرفی شدند: کاشفان سلول‌های تنظیم‌کننده سیستم ایمنی بدن
سرخط خبرها

ابزار VASA-1 تصاویر را سخنگو می‌کند | خوب و بد هوش مصنوعی جدید مایکروسافت

  • کد خبر: ۲۲۳۲۲۴
  • ۰۲ ارديبهشت ۱۴۰۳ - ۱۵:۳۹
ابزار VASA-1 تصاویر را سخنگو می‌کند | خوب و بد هوش مصنوعی جدید مایکروسافت
هوش مصنوعی جدید مایکروسافت می‌تواند یک عکس ثابت را متحرک کند و امکانی فراهم بیاورد که با چهره هر شخصیتی که دوست دارید صحبت کنید.

به گزارش شهرآرانیوز، پژوهشگران شرکت مایکروسافت در آسیا از یک ابزار هوش مصنوعی جدید به نام VASA-1 رونمایی کرده‌اند. این ابزار نوآورانه می‌تواند، با استفاده از یک تصویر ثابت یا حتی طرحی از فرد و یک فایل صوتی موجود، به‌صورت لحظه‌ای چهره‌ای متحرک و بسیار واقعی بسازد. هوش مصنوعی جدید مایکروسافت قادر است براساس فایل صوتی (مانند سخنرانی یا آهنگ)، حرکات لب و حالات چهره و چرخش سر را برای تصویر یا طرح اولیه تولید کند. پژوهشگران نمونه‌های فراوانی را در صفحه پروژه به‌اشتراک گذاشته‌اند که چنان طبیعی به‌نظر می‌رسند که می‌توانند به‌راحتی مخاطب را فریب دهند.

شاید اگر با دقت زیادی نمونه‌های منتشرشده را بررسی کنید، متوجه کمی تصنع یا نامتناسب‌بودن حرکات لب و سر شوید، اما همچنان واضح است که این فناوری می‌تواند به‌سادگی و با سرعت برای ساخت ویدئو‌های دیپ فیک افراد واقعی مورد سوءاستفاده قرار بگیرد. خود پژوهشگران نیز از این پتانسیل آگاه هستند و تصمیم گرفته‌اند، تا زمانی که از «استفاده مسئولانه و مطابق با قوانین» این فناوری اطمینان حاصل نکنند، از عرضه «دموی آنلاین، رابط برنامه‌نویسی کاربردی، محصول نهایی، جزئیات بیشتر در مورد پیاده‌سازی، یا هرگونه خدمات مرتبط» خودداری کنند. با این حال، آن‌ها نگفتند که آیا اقدامات حفاظتی خاصی را برای جلوگیری از سوءاستفاده افراد (مانند ساخت هرزه‌نگاری جعلی یا راه‌اندازی کمپین‌های اطلاعات غلط) در نظر گرفته‌اند یا نه.

پژوهشگران بر این باورند که این فناوری هوش مصنوعی، فراتر از پتانسیل‌های مخرب خود، مزایای فراوانی دارد. آن‌ها گفته‌اند که VASA-1 می‌تواند برای ارتقای برابری آموزشی و همچنین بهبود دسترسی افراد با چالش‌های ارتباطی مفید باشد؛ برای مثال، افراد می‌توانند آواتاری داشته باشند که به‌جایشان صحبت کند. آن‌ها همچنین اشاره کرده‌اند که این فناوری می‌تواند برای کسانی که نیاز به همراهی و حمایت درمانی دارند مؤثر باشد. این نشان می‌دهد که VASA-1 می‌تواند در برنامه‌هایی که امکان برقراری ارتباط با شخصیت‌های هوش مصنوعی را فراهم می‌کنند به‌کار گرفته شود.

طبق مقاله منتشرشده همراه با معرفی این ابزار، VASA-1 با استفاده از مجموعه‌داده VoxCeleb2 آموزش دیده است. این مجموعه شامل «بیش از یک‌میلیون جمله صوتی برای ۶۱۱۲ فرد مشهور» است که از ویدئو‌های یوتیوب استخراج شده‌اند. جالب اینجاست که این ابزار، با وجود آموزش روی چهره‌های واقعی، روی تصاویر هنری (مانند نقاشی چهره مونالیزا) نیز کار می‌کند. پژوهشگران، برای نمایش قابلیت‌های VASA-1، آن را با فایل صوتی اجرای معروف و وایرال آن هتوی از آهنگ Paparazzi، اثر لیل وین، نیز ترکیب کرده‌اند. این خروجی چنان سرگرم‌کننده است که حتی اگر درباره فواید چنین فناوری‌ای تردید داشته باشید ارزش دیدن دارد. این ویدئو را در زیر ببینید:

منبع: گجت‌نیوز

گزارش خطا
ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.
پربازدید
آخرین اخبار پربازدیدها چند رسانه ای عکس
{*Start Google Analytics Code*} <-- End Google Analytics Code -->